The 1$^{\text{st}}$ Workshop on Maritime Computer Vision (MaCVi) 2023 focused on maritime computer vision for Unmanned Aerial Vehicles (UAV) and Unmanned Surface Vehicle (USV), and organized several subchallenges in this domain: (i) UAV-based Maritime Object Detection, (ii) UAV-based Maritime Object Tracking, (iii) USV-based Maritime Obstacle Segmentation and (iv) USV-based Maritime Obstacle Detection. The subchallenges were based on the SeaDronesSee and MODS benchmarks. This report summarizes the main findings of the individual subchallenges and introduces a new benchmark, called SeaDronesSee Object Detection v2, which extends the previous benchmark by including more classes and footage. We provide statistical and qualitative analyses, and assess trends in the best-performing methodologies of over 130 submissions. The methods are summarized in the appendix. The datasets, evaluation code and the leaderboard are publicly available at https://seadronessee.cs.uni-tuebingen.de/macvi.
translated by 谷歌翻译
我们设计了快速算法,以反复从强烈的雷利分布中采样,其中包括随机跨越树分布和确定点过程。对于图$ g =(v,e)$,我们展示了如何大致统一的随机样本从$ g $ in $ \ wideTilde {o}(\ lvert v \ rvert)$ plime plimation $ \ in tampl of $ \ wideTilde {o}(\ lvert v \ rvert)$ time。 widetilde {o}(\ lvert e \ rvert)$时间预处理。对于$ n $元素的地面集的尺寸$ k $子集的确定点过程,我们将显示如何在$ \ widetilde {o}(k^\ omega)$ time of timit $ \ wideTilde { o}(nk^{\ omega-1})$时间预处理,其中$ \ omega <2.372864 $是矩阵乘法指数。我们甚至改进了从确定点过程中获取单个样本的最新技术,从$ \ widetilde {o}的先前运行时(\ min \ {nk^2,n^\ omega \})$到$ \ widetilde {o}(nk^{\ omega-1})$。在我们的主要技术结果中,我们达到了强烈的雷利分布的最佳范围稀疏限制。在域稀疏中,从$ \ binom {[n]} {k} $上的分配$ \ mu $取样减少为$ \ binom {[t]} {k} $ for $ t \ ll的相关发行量的采样n $。我们表明,对于强烈的瑞利分布,我们可以实现最佳$ t = \ widetilde {o}(k)$。我们的还原涉及从$ \ widetilde {o}(1)$ domain-sparsparsified发行版进行采样,所有这些分布都可以有效地产生,假设$ \ mu $的边际上的近似近距离访问方便的访问。可以访问边际类似于访问连续分布的平均值和协方差,或者知道分布的“各向同性”,这是Kannan-lov \'asz-simonovits(KLS)的关键假设(KLS)的猜想,并基于基于最佳采样器它。我们认为我们的结果是KLS猜想的道德类似物及其对采样的后果,以实现强烈的瑞利度量。
translated by 谷歌翻译
在本文中,我们探索了开放式剪影到照片转换,旨在将备用素描与其类标签中的徒手素描合成,即使培训数据中缺少该类的草图。由于缺乏训练监督和写法草图和照片域之间的大几何扭曲,这是挑战性的。要从照片中综合缺少的手绘草图,我们提出了一个框架,共同学习素描到照片和照片到素描生成。然而,由于合成草图和真实的域间隙,从假草图训练的发电机可能导致缺失类的草图时导致不满意的结果。为了缓解这个问题,我们进一步提出了一种简单但有效的开放式采样和优化策略,以“愚弄”将发电机视为真实的草图。我们的方法利用了域名数据的学习素描到照片和照片到草图映射,并将其概括为开放式域类。我们在涂鸦和Sketchycoco数据集上验证我们的方法。与最近的竞争方法相比,我们的方法显示令人印象深刻的成果,在综合逼真的颜色,纹理和维护各类开放式域草图的几何组合物方面。我们的代码可在https://github.com/mukosame/aoda获得
translated by 谷歌翻译
We study grammar induction with mildly context-sensitive grammars for unsupervised discontinuous parsing. Using the probabilistic linear context-free rewriting system (LCFRS) formalism, our approach fixes the rule structure in advance and focuses on parameter learning with maximum likelihood. To reduce the computational complexity of both parsing and parameter estimation, we restrict the grammar formalism to LCFRS-2 (i.e., binary LCFRS with fan-out two) and further discard rules that require O(n^6) time to parse, reducing inference to O(n^5). We find that using a large number of nonterminals is beneficial and thus make use of tensor decomposition-based rank-space dynamic programming with an embedding-based parameterization of rule probabilities to scale up the number of nonterminals. Experiments on German and Dutch show that our approach is able to induce linguistically meaningful trees with continuous and discontinuous structures
translated by 谷歌翻译
Bandit算法被广泛用于顺序决策问题,以最大程度地提高累积奖励。一种潜在的应用程序是移动健康,其目标是通过基于通过可穿戴设备获得的用户特定信息来促进用户的健康。重要的考虑因素包括收集数据的类型和频率(例如GPS或连续监视),因为这些因素会严重影响应用程序性能和用户的依从性。为了平衡收集与影响应用程序性能的限制的数据的需求,人们需要能够评估变量的实用性。匪徒反馈数据是顺序相关的,因此为独立数据开发的传统测试程序无法应用。最近,针对参与者批判的匪徒算法开发了统计测试程序。演员批评算法保留了两个独立的模型,一个用于演员,行动选择政策,另一个用于评论家,奖励模型。仅当正确指定评论家模型时,算法的性能以及测试的有效性才能保证。但是,由于功能不正确或缺失协变量,在实践中经常进行错误指定。在这项工作中,我们提出了一种经过改进的参与者批评算法,在这种情况下,对批评者的误解是可靠的,并为参与者参数提供了新颖的测试程序。
translated by 谷歌翻译
训练神经网络的一种常见方法是将所有权重初始化为独立的高斯向量。我们观察到,通过将权重初始化为独立对,每对由两个相同的高斯向量组成,我们可以显着改善收敛分析。虽然已经研究了类似的技术来进行随机输入[Daniely,Neurips 2020],但尚未使用任意输入进行分析。使用此技术,我们展示了如何显着减少两层relu网络所需的神经元数量,均在逻辑损失的参数化设置不足的情况下,大约$ \ gamma^{ - 8} $ [Ji and telgarsky,ICLR, 2020]至$ \ gamma^{ - 2} $,其中$ \ gamma $表示带有神经切线内核的分离边距,以及在与平方损失的过度参数化设置中,从大约$ n^4 $ [song [song]和Yang,2019年]至$ n^2 $,隐含地改善了[Brand,Peng,Song和Weinstein,ITCS 2021]的近期运行时间。对于参数不足的设置,我们还证明了在先前工作时改善的新下限,并且在某些假设下是最好的。
translated by 谷歌翻译
机器学习(ML)是人工智能(AI)的子场,其放射学中的应用正在以不断加速的速度增长。研究最多的ML应用程序是图像的自动解释。但是,可以将自然语言处理(NLP)与文本解释任务组合的ML结合使用,在放射学中也具有许多潜在的应用。一种这样的应用是放射学原始胶体的自动化,涉及解释临床放射学转介并选择适当的成像技术。这是一项必不可少的任务,可确保执行正确的成像。但是,放射科医生必须将专门用于原始胶片的时间进行报告,与推荐人或教学进行报告,交流。迄今为止,很少有使用临床文本自动选择协议选择的ML模型的出版物。本文回顾了该领域的现有文献。参考机器学习公约建议的最佳实践对已发布模型进行系统评估。讨论了在临床环境中实施自动质胶的进展。
translated by 谷歌翻译
生成的对抗网络(GAN)是在众多领域成功使用的一种强大的深度学习模型。它们属于一个称为生成方法的更广泛的家族,该家族通过从真实示例中学习样本分布来生成新数据。在临床背景下,与传统的生成方法相比,GAN在捕获空间复杂,非线性和潜在微妙的疾病作用方面表现出增强的能力。这篇综述评估了有关gan在各种神经系统疾病的成像研究中的应用的现有文献,包括阿尔茨海默氏病,脑肿瘤,脑老化和多发性硬化症。我们为每个应用程序提供了各种GAN方法的直观解释,并进一步讨论了在神经影像学中利用gans的主要挑战,开放问题以及有希望的未来方向。我们旨在通过强调如何利用gan来支持临床决策,并有助于更好地理解脑部疾病的结构和功能模式,从而弥合先进的深度学习方法和神经病学研究之间的差距。
translated by 谷歌翻译
保持最新的地图以反映现场的最新变化非常重要,尤其是在涉及在延长环境中操作的机器人重复遍历的情况。未发现的变化可能会导致地图质量恶化,导致本地化差,操作效率低下和机器人丢失。体积方法,例如截断的签名距离功能(TSDF),由于其实时生产致密而详细的地图,尽管在随着时间的推移随着时间的流逝而变化的地图更新仍然是一个挑战,但由于它们的实时生产而迅速获得了吸引力。我们提出了一个框架,该框架引入了一种新颖的概率对象状态表示,以跟踪对象在半静态场景中的姿势变化。该表示为每个对象共同对平稳性评分和TSDF变更度量进行建模。同时加入几何信息和语义信息的贝叶斯更新规则被得出以实现一致的在线地图维护。为了与最先进的方法一起广泛评估我们的方法,我们在仓库环境中发布了一个新颖的现实数据集。我们还评估了公共Toycar数据集。我们的方法优于半静态环境重建质量的最先进方法。
translated by 谷歌翻译
作为生成部件作为自回归模型的向量量化变形式自动化器(VQ-VAE)的集成在图像生成上产生了高质量的结果。但是,自回归模型将严格遵循采样阶段的逐步扫描顺序。这导致现有的VQ系列模型几乎不会逃避缺乏全球信息的陷阱。连续域中的去噪扩散概率模型(DDPM)显示了捕获全局背景的能力,同时产生高质量图像。在离散状态空间中,一些作品已经证明了执行文本生成和低分辨率图像生成的可能性。我们认为,在VQ-VAE的富含内容的离散视觉码本的帮助下,离散扩散模型还可以利用全局上下文产生高保真图像,这补偿了沿像素空间的经典自回归模型的缺陷。同时,离散VAE与扩散模型的集成解决了传统的自回归模型的缺点是超大的,以及在生成图像时需要在采样过程中的过度时间的扩散模型。结果发现所生成的图像的质量严重依赖于离散的视觉码本。广泛的实验表明,所提出的矢量量化离散扩散模型(VQ-DDM)能够实现与低复杂性的顶层方法的相当性能。它还展示了在没有额外培训的图像修复任务方面与自回归模型量化的其他矢量突出的优势。
translated by 谷歌翻译